Материалы по тегу: sapphire rapids
12.01.2023 [16:30], Сергей Карасёв
ASUS представила серверы на базе Intel Xeon Sapphire Rapids, в том числе с СЖОКомпания ASUS анонсировала серверы на аппаратной платформе Intel Xeon Sapphire Rapids. Дебютировали модели RS720-E11 и RS700-E11 для задач ИИ, НРС и облачных платформ, решение высокой плотности RS720Q-E11, GPU-сервер ESC8000-E11, а также вариант ESR1-511-X4TF для периферийных вычислений. 2U-сервер RS720-E11 допускает установку 32 модулей оперативной памяти DDR5-4800/4400, двух карт расширения PCIe 5.0 x8 или одной карты PCIe 5.0 x16 (FHFL или FHHL), одной платы OCP 3.0 и одной низкопрофильной PCIe 5.0 x16. Во фронтальной части находятся 24 отсека для SFF-накопителей (12 × NVMe/SATA/SAS и 12 × NVMe). В оснащение входят четыре сетевых порта 1Gbe (Intel I350-AM4) или два порта 10Gbe (Intel X710-AT2), сетевой порт управления, четыре разъёма USB 3.2 Gen1 и два блока питания на 2600/1600 Вт. 1U-модель RS700-E11 предлагает 32 слота для модулей DDR5-4800/4400, 12 отсеков для SFF-накопителей NVMe/SATA/SAS, два разъёма M.2. Слоты расширения выполнены по схеме 1 × OCP 3.0 или PCIe 5.0 x16 FHFL, 1 × PCIe 5.0 x16 FHFL, 1 × PCIe 5.0 x8. LP и 1 × PCIe 5.0 x16 LP. Прочие характеристики аналогичны версии RS720-E11. Решение RS720Q-E11 — четырёхузловой сервер формата 2U с поддержкой прямого жидкостного охлаждения. Каждый из узлов поддерживает установку двух процессоров Xeon Sapphire Rapids, 16 модулей DDR5-4800 RDIMM (3DS), двух карт расширения PCIe 5.0 x16, двух накопителей M.2. Сервер оборудован восемью фронтальными отсеками для SFF-устройств NVMe/SATA/SAS и двумя блоками питания мощностью 3000 Вт. GPU-сервер ESC8000-E11 формата 4U — двухсокетная платформа с возможностью установки восьми ускорителей PCIe 5.0 x16 (FHFL). Есть 32 слота для модулей DDR5-4800/4400, восемь фронтальных отсеков для LFF-накопителей NVMe/SATA/SAS, два сетевых порта 10GbE (RJ45, X710-AT2) или 1GbE (RJ45, I350-AM2). Подсистема питания может быть выполнена по схеме 2 + 2 с блоками мощностью 2600/3000 Вт. Что касается edge-сервера ESR1-511-X4TF, то он имеет формат 1U с фронтальным доступом. Глубина составляет 430 мм. Есть два слота FH3/4L для карт GPU или FPGA. Некоторые модели комплектуются ускорителем Intel vRAN Accelerator ACC100.
12.01.2023 [15:53], Сергей Карасёв
Wiwynn представила edge-сервер EP100G2 на платформе Intel Xeon Sapphire RapidsКомпания Wiwynn анонсировала сервер EP100G2 для периферийных вычислений и платформ 5G RAN. Поддерживается установка новейших процессоров Intel Xeon Sapphire Rapids. В шасси формата 3U могут монтироваться модули стандартов 1U и 2U половинной ширины: в первом случае TDP чипа не должно превышать 205 Вт, во втором — 225 Вт. Изделия 1U могут комплектоваться двумя накопителями M.2 NVMe. Можно установить два SFF-устройства U.2 и одну карту PCIe 5.0 x16 FHHL (альтернативный вариант — по одной карте PCIe 5.0 x8 FHHL и PCIe 4.0 x8 LP). Есть восемь слотов для модулей оперативной памяти DDR5-4800. Габариты составляют 41 × 215 × 421,8 мм, вес — 3,5 кг. Решения 2U предоставляют два слота M.2 NVMe и четыре посадочных места для SFF-накопителей U.2. Предусмотрено по одному слоту PCIe 5.0 x16 FHFL, PCIe 5.0 x8 FHFL и PCIe 5.0 x8 FHHL. Размеры — 82 × 215 × 421,8 мм, вес — 5,42 кг. Общие габариты сервера равны 130,6 × 440 × 430 мм, вес — 25 кг. Доступны два 10GbE-порта 10G SFP+ и один порт 1GbE RJ45. В оснащение входят два блока питания мощностью 2000 Вт. Диапазон рабочих температур — от -5 до +55 °C. Более подробную информацию о сервере Wiwynn EP100G2 можно найти здесь.
12.01.2023 [15:47], Алексей Степин
Atos представила серверы BullSequana SH и edge-платформы EXR и EXD на базе Sapphire RapidsНовые процессоры Intel Xeon с архитектурой Sapphire Rapids навёрстывают упущенное и находят своё место в новых моделях серверов. На этот раз о новинках объявила компания Atos, представившая вычилительную систему BullSequana SH класса HPC и новые серверы в серии EX. Система BullSequana SH является модульной и расширяемой, базовым строительным блоком служит модуль SH20 с двумя процессорам Sapphire Rapids и 32 слотами DDR5 с поддержкой Optane PMem 300. Опциально такой модуль может нести на борту и пару DPU или GPU. До четырёх таких блоков можно объединить в единую систему с 8 процессорами, 32 Тбайт оперативной памяти и 8 ускорителями. Для этого нужны лишь UPI-коннекторы. Однако это не предел: с помощью специального модуля UBox высотой 3U, систему можно расширять и далее, не прибегая к помощи InfiniBand или иных сетей. Модуль UBox содержит внутри два контроллера Intel Ultra Path Interconnect (UPI), что позволяет с помощью одного модуля объединить в единую NUMA-систему до 16 процессоров. С помощью ещё одного UBox это число можно довести до 32 — именно такую конфигурацию имеет старшая модель BullSequana SH320. Все решения в серии SH поддерживают новые модели Xeon с числом ядер от 8 до 60 и частотами до 4,2 ГГц. Каждый модуль располагает двумя (1+1) блоками питания мощностью от 2200 до 3000 Вт, а также 12 вентиляторами с возможностью горячей замены. Для загрузки ОС в каждом модуле имеется 2 слота M.2, но опционально доступны дополнительные модули для установки NVMe-накопителей, а также корзины для GPU и PCIe-устройств с поддержкой горячей замены. Компания также уделила внимание периферийным вычислениям: для этой сферы предназначены новые серверы BullSequana Edge EXR и EXD в корпусах 1U и 2U соответственно. Системы рассчитаны на использование процессоров Sapphire Rapids с числом ядер не более 24 и теплопакетом, не превышающим 185 Вт. Серверы могут функционировать при температурах от 0 до +45 °C в диапазоне влажности от 5% до 95%. Предусмотрена возможность крепления на стену. При этом предусмотрена возможность установки широкого ассортимента различных ускорителей — в спецификациях упоминаются NVIDIA T4, L40, H100, A2 и A16. Опционально в состав систем может входить поддержка беспроводных сетей LTE/5G, LoRA и Wi-Fi 6, поэтому серверы отлично подойдут и для развёртывания на периферии беспроводной инфраструктуры нового поколения. Модель EXR располагает 2 слотами M.2, но может комплектоваться дополнительной корзиной на 6 дисков SATA или 8 NVMe-накопителей, а EXD в некоторых конфигурациях может вмещать до 8 накопителей M.2 NVMe. Обе модели комплектуются двухпортовым 10GbE-контроллером (опционально 25GbE). Все новые системы Atos на базе новых процессоров Intel Xeon обеспечивают высокую степень безопасности благодаря поддержке Atos Root of Trust и Atos Chain-of-Trust.
11.01.2023 [19:12], Алексей Степин
Серверы HPE ProLiant Gen11 получили Intel Xeon Sapphire RapidsОдной из первых компаний, отреагировавших на анонс четвёртого поколения серверных процессоров Intel Xeon Scalable (Sapphire Rapids), закономерно стала HPE. Ранее она уже анонсировала 11-ое поколение серверов ProLiant, причём серию фактически открыли Arm-серверы RL300 с Ampere Altra, к которым позже присоединились модели с AMD EPYC Genoa, а теперь ProLiant Gen11 получили и Sapphire Rapids. Открывает Intel-серию ProLiant DL320 Gen11 — наиболее простая, но при этом универсальная модель, способная одинаково хорошо послужить в качестве платформы для организации VDI и в качестве основы для системы потокового видео, а также поработать на благо периферийной ИТ-инфраструктуры. Это однопроцессорная 1U-модель, что накладывает ограничения по теплопакету — поддерживаются только процессоры с числом ядер, не превышающим 32. Ускорителей можно установить два, но оба должны иметь формат FHHL, так как слишком длинным картам помешает процессорное гнездо и модули DIMM. Имеется также разъём OCP, который можно использовать для апгрейда сетевой части. В зависимости от пожеланий заказчика сервер может использовать либо четыре полноразмерных накопителя LFF, либо 10 накопителей в формате SFF. Классом выше располагается ProLiant DL360 Gen11 — универсальный сервер, оптимизированный для высокоплотных сред. Здесь решение в корпусе высотой 1U имеет уже два процессорных гнезда, поддерживающие всю серию Sapphire Rapids, включая 60-ядерные Xeon Platinun 8490H. Платы ускорителей также должны иметь укороченную длину. Дисковая подсистема может включать как 4 LFF-диска, так и EDSFF-накопители — 10 × E3.S 2T или 20 × E3.S 1T. Модель ProLiant DL380 Gen11 выполнена уже в корпусе высотой 2U и может похвастаться более серьёзными возможностями расширения. Она также использует двухсокетную материнскую плату, поддерживает 60-ядерные модели Xeon Scalable и вмещает три полноразмерных ускорителя с интерфейсом PCIe 5.0 x16, либо сразу восемь однослотовых. Сервер ориентирован на сферы, где требуется наличие ускорителей. Богаче здесь и опции дисковой подсистемы: они включают возможность установки дополнительных задних модулей. Максимальное число LFF-дисков — 12, SFF — 24, но есть и поддержка EDSFF — до 36 модулей E3.S 1T. Доступны различные опции RAID- и HBA-контроллеров, включая модели нового поколения с интерфейсом PCIe 5.0. Самая крупная по габаритам модель в новом семействе — ProLiant ML350 Gen11, поскольку по умолчанию она использует башенную ориентацию 4U-корпуса (в стойку его тоже можно поставить). Данная модель может предоставить 10 слотов расширения PCIe 5.0 и два слота OCP x16. Корпус вмещает до 12 дисков LFF, либо до 24 дисков SFF (в том числе с PCIe x1), а вот число NVMe SSD с x4-подключением ограничено восемью. Эта модель предназначена для использования в периферийных бизнес-филиалах, где не всегда есть возможность разместить стойку с оборудованием. Благодаря своей расширяемости, система может выполнять практически любой круг задач. Ах да, поддерживаемые модели процессоров всё те же, включая варианты с 60 ядрами и версии с интегрированной памятью HBM. Все серверы HPE ProLiant Gen11 используют фирменную систему управления iLO 6 с возможностью подключения к облачной службе GreenLake. Компания также планирует к выпуску другие модели серверов 11-ого поколения:
Также в планах версии с расширенной поддержкой ускорителей. Все они будут анонсированы, по словам компании, в ближайшее время.
11.01.2023 [18:40], Сергей Карасёв
AIC представила три сервера на платформе Intel Xeon Sapphire RapidsКомпания AIC анонсировала серверы на новейшей аппаратной платформе Intel Xeon Sapphire Rapids. Дебютировали модели SB102-HK, SB201-HK и HP202-KT, которые, как утверждается, обеспечивают высокую производительность и отличную энергетическую эффективность. Модель SB102-HK выполнена в форм-факторе 1U с размерами 438 × 800 × 43,75 мм. Доступны 32 слота для модулей оперативной памяти DDR5-4800/5600. Во фронтальной части расположены 12 отсеков для SFF-накопителей NVMe. Есть по два слота PCIe 5.0 х16 и OCP 3.0, BMC-контроллер Aspeed AST2600, адаптер Realtek RTL8211EL (выделенный сетевой порт управления), три разъёма USB 3.0 и аналоговый коннектор D-Sub. Возможна установка двух блоков питания на 1200 или 1600 Вт. Сервер SB201-HK формата 2U имеет габариты 438 × 800 × 87,5 мм. Эта система также предоставляет 32 слота для модулей DDR5-4800/5600. Спереди расположены 24 отсека для SFF-накопителей NVMe, сзади — два отсека для SFF-устройств SATA. Кроме того, предусмотрены два внутренних слота M.2/NGFF-M (SATA и PCIe x4). Доступны по два разъёма PCIe 5.0 х16 и OCP 3.0. Упомянуты контроллеры Aspeed AST2600, Realtek RTL8211EL, четыре порта USB 3.0 и два блока питания (1200 или 1600 Вт). Третья новинка, HP202-KT, представляет собой четырёхузловую систему стандарта 2U с размерами 438 × 850 × 87 мм. Каждый из узлов наделён 16 слотами для модулей DDR5-4800/5600, тремя отсеками для LFF-накопителей, двумя разъёмами PCIe 5.0 х16 и одним слотом OCP 3.0, контроллерами Aspeed AST2600 и Realtek RTL8211F. Применяются блоки питания мощностью 2400 или 3000 Вт.
11.01.2023 [16:40], Алексей Степин
HPE Alletra 4000: Intel Xeon Sapphire Rapids + гибкая и ёмкая дисковая подсистема, в том числе с E3.S SSDКомпания Intel анонсировала четвёртое поколение серверных процессоров Xeon Scalable под кодовым именем Sapphire Rapids. Его особенностям посвящена отдельная заметка, отметим лишь, что новые Xeon отличаются высокой универсальностью благодаря полноценной поддержке AVX-512, расширений AMX и наличию ряда интегрированных ускорителей — QAT, DSA, DLB и IAA. Часть производителей серверов анонсировала обновление модельного ряда ещё в конце прошлого года, а часть решила дождаться официального анонса Intel. Так, HPE переименовала серию серверов Apollo 4000 в Alletra 4000; в новой серии дебютировало пока две модели, Alletra 4110 и 4120, и обе построены именно на базе Sapphire Rapids. Несмотря на компактные габариты (1U) Alletra 4110 обладает серьёзными возможностями как в области процессорных мощностей, неся на борту два новых Xeon (вплоть до 48-ядерных Platinum 8648) с 3 Тбайт RAM, так и в области хранения данных с 20 отсеками EDSFF E3.S (суммарно до 307,2 Тбайт). Последние подключены к шине PCI Express 5.0 и обеспечивают совокупную скорость обмена данными до 315 Гбайт/с. В другом варианте используется двухуровневая корзина на 20 накопителей формата SFF. Благодаря расширенным возможностям Sapphire Rapids новинка отлично подойдет для систем машинного обучения, СУБД, а также в качестве узла гиперконвергентной инфраструктуры. Платформа Alletra 4120 — замена Apollo 4200 Gen10 и дополнение Apollo 4200 Gen10 Plus. Она использует корпус высотой 2U, в котором может быть установлено 1 или 2 контроллера на базе новых Xeon (до Platinum 8648) с общим объёмом оперативной памяти до 6 Тбайт. Дисковая система, как и у предшествующих моделей, здесь гибридная: корзины в передней части могут вмещать либо 24 диска формата LFF, либо 48 более компактных SFF, в задней же части устанавливается ещё 4 LFF, 12 EDSFF или 6 SFF-накопителей. При этом поддерживаются диски с интерфейсами SAS-4, SATA-3 и NVMe PCIe 5.0; для последних обеспечивается пропускная способность до 225,6 Гбайт/с. Предельная ёмкость дисковой системы составляет 734,4 Тбайт при использовании SAS-дисков. Сервер хорошо подходит для любых задач, связанных с хранением больших объёмов данных, от хранилища наборов данных машинной аналитики до задач архивации и защиты ценной информации. Обе новинки HPE поддерживают концепцию Zero Trust. За удалённое управление отвечает фирменная технология HPE iLO 6. В случае подключения к облачной платформе HPE GreenLake применяется пятифакторная модель аутентификации. Доступны новинки станут во II квартале 2023 года.
11.01.2023 [14:35], Сергей Карасёв
Gigabyte представила серверы и платы под Intel Xeon Sapphire RapidsGiga Computing, подразделение компании Gigabyte, специализирующееся на продуктах корпоративного класса, представило первую волну серверов и материнских плат с поддержкой новейших процессоров Intel Xeon Sapphire Rapids, о которых можно подробно узнать в нашем материале. «Новые чипы имеют самое большое число встроенных ускорителей среди всех процессоров на рынке, что помогает максимизировать производительность для развивающихся рабочих нагрузок, виртуализации и ИИ. Усовершенствования делают эту платформу идеальной для ИИ, облачных вычислений, углублённой аналитики, НРС, сетей и систем хранения данных», — заявляет Giga Computing. С процессорами Xeon Sapphire Rapids совместимы материнские платы серий MS73, MS03 и MS33, обеспечивающие поддержку PCIe 5.0. Это, например, двухсокетная модель MS73-HB0 с четырьмя LAN-портами (2 × 10GbE и 2 × 1GbE). В семейство стоечных серверов R-series, подходящих для Xeon Sapphire Rapids, входят решения форматов 1U и 2U. Это серии R283, R183, R162, R163 и R263, включая 1U-модель R163-S32 с возможностью установки 12 накопителей SATA или U.2. В категории GPU-серверов G-Series типоразмера 2U и 4U анонсированы новые серии G293 и G593. К примеру, двухсокетная версия G293-S41 поддерживает восемь двухслотовых карт PCIe 5.0, накопители SATA и U.2. Серверы высокой плотности H-Series формата 2U имеют четырёхузловую конфигурацию. В новой серии H263 представлена модель H263-S62 с поддержкой 24 SFF-накопителей U.2/SAS/SATA и прямого жидкостного охлаждения. Наконец, edge-серверы E-Series стандарта 1U и 2U получили пополнение в виде серий E283, E263 и E163. Так, решение E163-S30 наделено слотами для карт FHHL PCIe и OCP 3.0, а также резервным блоком питания.
11.01.2023 [03:00], Игорь Осколков
Асимметричный ответ: Intel официально представила процессоры Xeon Sapphire RapidsIntel официально представила серверные процессоры Xeon семейства Sapphire Rapids (SPR), выход которых изрядно задержался, а также ускорители ранее известные как Ponte Vecchio и теперь объединённые вместе с HBM-версиями SPR в отдельную HPC-серию Max. В этом поколении Intel не смогла догнать AMD EPYC Genoa по числу ядер, числу каналов памяти и линий PCIe, но заготовила ассиметричный, хотя и очень странно реализованный ответ. Всего представлено 52 модели с числом P-ядер от 8 до 60 и с TDP от 125 до 350 Вт. По числу ядер это существенный апгрейд по сравнению с Ice Lake-SP (до 40 ядер), да и IPC вырос у Golden Cove на 15 % в сравнении с Sunny Cove. Но это существенный проигрыш в сравнении с Genoa (до 96 ядер), особенно если учитывать их максимальный TDP в 360 Вт (cTDP до 400 Вт). Правда, у Sapphire Rapids есть ещё и экономичный режим работы, в котором энергопотребление снижается на 20 %, а производительность для некоторых нагрузок — всего на 5 %. Sapphire Rapids предлагают 8 каналов памяти DDR5-4800 (1DPC) и DDR5-4400 (2DPC). 2DPC у Genoa пока что нет. Кроме того, контроллеры поддерживают и модули Optane PMem 300 (Crow Pass), но с учётом того, что производство 3D XPoint прекращено, достаться они могут не всем (впрочем, не всем они и нужны). Ну а маленькая серия Max также включает 64 Гбайт набортной HBM2e-памяти (1,2 Тбайт/с). Остались и отличия в максимальном объёме SGX-анклавов в зависимости от модели CPU. Однако по числу ядер на узел всё равно лидирует Intel. Если AMD поддерживает только 2S-конфигурации, то Intel снова предлагает и 4S, и 8S (а с момента выхода Cooper Lake-SP прошло немало времени) — на процессор доступно до 4 линий UPI 2.0 (16 ГТ/с в сравнении с 11,2 ГТ/с у Ice Lake-SP). В 2S-платформах Sapphire Rapids также формально обгоняет Genoa по числу линий PCIe 5.0, которых тут по 80 шт. на сокет. Формально потому, что в случае Genoa при желании всё же можно получить 160 линий, пожертвовав скоростью шины между CPU, но в односокетном варианте EPYC в любом случае интереснее Xeon. Без нюансов тут не обошлось. Так, при бифуркации до 8 x2 скорость падает до PCIe 4.0. Зато каждый root-комплекс поддерживает CXL 1.1, тогда как у Genoa CXL есть только у половины! Впрочем, поддержка всё равно ограничена 4x CXL-устройствами на CPU. Что ещё более странно, официально заявлена поддержка только устройств Type 1 и Type 2, но не Type 3, хотя последние весьма пригодились бы в ряде конфигураций, где требуется больше относительно недорогой, пусть и несколько более медленной, RAM. Сохранилось традиционное разделение на серии Platinum (8000), Gold (6000/5000), Silver (4000) и Bronze (3000), к которым теперь добавилась серия Max (9400). Список суффиксов, означающих оптимизацию под те или иные задачи и наличие каких-то особенностей, стал чуть шире: Y (SST-PP 2.0), Q (рассчитаны на работу с СЖО), U (односокетные общего назначения), T (увеличенный жизненный цикл), H (in-memory СУБД, аналитика, виртуализация), N (сетевые решения, в том числе для 5G), облачные P/V/M (IaaS/Paa/медиа), S (СХД и HCI). Но некоторые модели также имеют в названии «+». И вот тут начинается самое интересное! Все процессоры получили «традиционную» (в сравнении с Genoa) реализацию AVX-512, включая DL Boost, а также целый новый набор ИИ-инструкций AMX (до 10 раз быстрее обучение и инференс в сравнении с Ice Lake-SP). Есть и всяческие Speed Select, DDIO, TDX, CET и т.д. Но Sapphire Rapids также получили четыре отдельных ускорителя:
Intel заявляет, что средний прирост производительности Sapphire Rapids в сравнении с Ice Lake-SP составил 1,53 раза. А вот для ряда нагрузок, которые могут задействовать новые ускорители прирост производительности на Вт составляет уже до 2,9 раз! То есть Intel продолжает придерживаться стратегии создания максимально универсальных CPU для различных нагрузок. И действительно, спорить с гибкостью Sapphire Rapids трудно. Но какой ценой это достигается? Т.е. буквально: во сколько это обойдётся заказчику? Ответа пока нет. Дело в том, что в зависимости от модели отличается число доступных и число активированных ускорителей. Фактически в новом поколении используется два вида кристаллов: XCC, «сшитые» из четырёх отдельных тайлов, и монолитные MCC (до 32 ядер, причём 32-ядерных моделей в серии большинство). У каждого тайла в XCC есть по одному блоку QAT, DSA, DLB и IAA, т.е. суммарно на CPU приходится до четырёх ускорителей каждого типа. В случае MCC может быть по два QAT и DLB и по одному DSA и IAA на процессор. Например, у тех моделей, что помечены «+», активно по одному блоку каждого типа, а минимум один DSA активен есть вообще у всех CPU. За не активированные по умолчанию ускорители придётся заплатить в рамках программы Intel On Demand (SDSi), причём есть опции как с единовременным платежом за постоянную активацию, так и с оплатой по факту использования (это удобно в случае облаков и платформ по типу HPE Greenlake). Исключением являются H-модели, куда входит и самый дорогой ($17000) 60-ядерный процессор 8490H с полностью разблокированными ускорителями и поддержкой 8S-конфигураций, а также процессоры Max, которым доступно только четыре DSA-блока и 2S-платформы, например, 56-ядерный 9480 ($12980). С одной стороны, желание Intel предоставить больше гибкости заказчикам, а заодно чуть увеличить выход годных к продаже процессоров, понятно. С другой — не очень-то и похоже, что CPU без «лишних» ускорителей отдаются с какой-то существенной скидкой. При этом транзисторный бюджет на них всё равно расходуется. Кроме того, есть ещё момент востребованности этих ускорителей и готовности ПО. У Intel есть и опыт ресурсы для помощи разработчикам, но процесс адаптации в любом случае не мгновенен. Впрочем, у Intel по сравнению с AMD есть и ещё одно важное преимущество — в среднем более высокая доступность процессоров для большинства заказчиков. Так что с Sapphire Rapids может повториться та же история, что с Ice Lake-SP, когда вендоры здесь и сейчас готовы были предложить Intel-платформы. В целом же, в новом семействе наиболее любопытны Xeon Max, которые, по словам Intel, по сравнению с прошлым поколением в 3,7 раз производительнее в задачах, завязанных на пропускную способность памяти (а это целый пласт HPC-нагрузок), и которые не так уж дороги. Правда, и здесь без приключений не обошлось — несчастный суперкомпьютер Aurora ожидает утомительный апгрейд его 10 тыс. узлов c простых Xeon Sapphire Rapids на Xeon Max — по полчаса на каждый узел.
16.12.2022 [15:26], Сергей Карасёв
В Аргентине появится 15,7-Пфлопс суперкомпьютер на платформе Intel MaxМинистр науки, технологий и инноваций Аргентины Даниэль Фильмус (Daniel Filmus) и министр обороны страны Хорхе Тайана (Jorge Taiana) рассказали о новом комплексе высокопроизводительных вычислений, который планируется ввести в эксплуатацию весной 2023 года. Безымянный пока суперкомпьютер расположится в вычислительном центре Национальной метеорологической службы Аргентины. Созданием системы занимаются специалисты Lenovo. Отличительной особенностью системы станет то, что они будет использовать исключительно процессоры и ускорители Intel Max. Комплекс объединит 5120 ядер процессоров Intel Max (HBM-версии чипов Xeon Sapphire Rapids) суммарной производительностью около 440 Тфлопс. Кроме того, будут задействованы 296 ускорителей Intel Max (Ponte Vecchio) с общим быстродействием 15,3 Пфлопс. Таким образом, пиковая производительность суперкомпьютера в целом составит примерно 15,7 Пфлопс. С таким показателем он мог бы претендовать на 82-е место в нынешнем рейтинге TOP500. Система получит 1,66 Пбайт памяти, 400G-сеть и систему прямого жидкостного охлаждения. Потребляемая мощность составит приблизительно 233 кВт. Суперкомпьютер планируется применять для широкого спектра научных задач, таких как разработка лекарственных препаратов, биоинформатика, наука о данных, искусственный интеллект и моделирование атмосферы. Нужно отметить, что сейчас Национальная метеорологическая служба Аргентины использует HPC-систему Huayra Muyu с пиковым быстродействием 370 Тфлопс.
10.11.2022 [01:55], Игорь Осколков
Intel объединила HBM-версии процессоров Xeon Sapphire Rapids и ускорители Xe HPC Ponte Vecchio под брендом MaxВ преддверии SC22 и за день до официального анонса AMD EPYC Genoa компания Intel поделилась некоторыми подробностями об HBM-версии процессоров Xeon Sapphire Rapids и ускорителях Ponte Vecchio, которые теперь входят в серию Intel Max. Intel Xeon Max предложат до 56 P-ядер, 112,5 Мбайт L3-кеша, 64 Гбайт HBM2e-памяти (четыре стека) с пропускной способностью порядка 1 Тбайт/с, 8 каналов памяти (DDR5-4800 в случае 1DPC, суммарно до 6 Тбайт), а также интерфейсы PCIe 5.0, CXL 1.1, UPI 2.0 и целый ряд различных технологий ускорения для задач HPC и ИИ: AVX-512, DL Boost, AMX, DSA, QAT и т.д. Заявленный уровень TDP составляет 350 Вт. Первым процессором с набортной HBM-памятью был Arm-чип Fujitsu A64FX (48 ядер, 32 Гбайт HBM2), лёгший в основу суперкомпьютера Fugaku. Intel поднимает планку, давая более 1 Гбайт быстрой памяти на каждое ядро. А поскольку процессор состоит из четырёх отдельных чиплетов, возможно создание четырёх NUMA-доменов с выделенными HBM- и DDR-контроллерами. Но и монолитный режим тоже имеется. А поддержка CXL даёт возможность задействовать RAM-экспандеры. Intel Xeon Max поддерживают 2S-платформы, что суммарно даёт уже 128 Гбайт HBM-памяти, которых вполне хватит для целого ряда задач. Новые процессоры действительно могут обходиться без DIMM. Но есть и два других режима. В первом HBM-память работает в качестве кеша для обычной памяти, и для системы это происходит прозрачно, так что никаких модификаций для ПО (как в случае отсутствия DIMM вообще) не требуется. Во втором режиме HBM и DDR представлены как отдельные пространства, так что тут дорабатывать ПО придётся, зато можно добиться более эффективного использования обоих типов памяти. В презентации Intel сравнивает новые Xeon Max с AMD EPYC Milan-X – в зависимости от задачи прирост составляет от +20 % до 4,8 раз. Но, во-первых, уже сегодня эти тесты потеряют всякий смысл в связи с презентацией EPYC Genoa (которые, к слову, должны получить AVX-512), а во-вторых, в следующем году AMD обещает представить Genoa-X с 3D V-Cache. Intel же явно не оставляет попытки создать как можно более универсальный процессор. Что касается Ponte Vecchio, которые теперь называются Max GPU, то практически ничего нового относительно строения и особенностей данных ускорителей Intel не сказала: до 128 ядер Xe (только теперь стало известно об аппаратном ускорении трассировки лучей, что важно для визуализации), 64 Мбайт L1-кеша и аж 408 Мбайт L2-кеша (из них 120 Мбайт приходится на Rambo-кеш в двух стеках), 16 линий Xe Link, 8 HBM2e-контроллеров на 128 Гбайт памяти и пиковая FP64-производительность на уровне 52 Тфлопс. Все эти характеристики относятся к старшей модели Max Series 1550 в OAM-исполнении с TDP в 600 Вт. Max Series 1350 предложит 112 ядер Xe и 96 Гбайт HBM2e, но и TDP у этой модели составит всего 450 Вт. Для обеих OAM-версий также будут доступны готовые блоки из четырёх ускорителей (по примеру NVIDIA RedStone), объединённых по схеме «каждый с каждым», так что в сумме можно получить 512 Гбайт HBM2e с ПСП в 12,8 Тбайт/с. Ну а самый простой ускоритель в серии называется Max Series 1100. Это 300-Вт PCIe-плата с 56 Xe-ядрами, 48 Гбайт HBM2e и мостиками Xe Link. Intel утверждает, что ускорители Max до двух раз быстрее NVIDIA A100 в некоторых задачах, но и здесь история повторяется — нет сравнения с более современными H100. Хотя предварительный доступ к этим ускорителям у Intel есть, поскольку именно Sapphire Rapids являются составной частью платформы DGX H100. В целом, Intel прямо говорит, что наибольшей эффективности вычислений позволяет добиться связка CPU и GPU серии Max в сочетании с oneAPI. Всего на базе решений данной серии готовится более 40 продуктов. Пока что приоритетным для Intel проектом является 2-Эфлопс суперкомпьютер Aurora, для которого пока что создан тестовый кластер Sunspot со 128 узлами, содержащими ускорители Max. Следующим ускорителем Intel станет Rialto Bridge, который появится в 2024 году. Также компания готовит гибридные (XPU) чипы Falcon Shores, сочетающие CPU, ускорители и быструю память. Аналогичный подход применяют AMD и NVIDIA. |
|